انتخاب ویژگی و بهینهسازی پارامترهای SVM با استفاده از الگوریتم جستجوی گرانشی باینری جهت تشخیص بیماری صرع 3 1 زینب باسره شهرام گلزاری هرمزی عباس حریفی -3 - دانشجوی کارشناسی ارشد مهندسی کامپیوتر هوش مصنوعی دانشگاه هرمزگان basereh.stuent@hormozgan.ac.r استادیار گروه مهندسی برق و کامپیوتر دانشگاه هرمزگان golzar@hormozgan.ac.r استادیار گروه مهندسی برق و کامپیوتر دانشگاه هرمزگان harf@hormozgan.ac.r -1 چکیده در این مقاله الگوریتم جستجوی گرانشی باینری برای انتخاب ویژگی و بهینهسازی پارامترهای ماشین بردار پشتیبان جهت طبقهبندی افراد سالم و بیماران مبتال به صرع استفاده شده است. انتخاب صحیح ویژگیها و پارامترهای این طبقهبند بر نتیجه تشخیص تا حد زیادی تاثیر میگذارد. همچنین کاهش ابعاد ویژگیها از منظر فضای الزم برای ذخیره و زمان مورد نیاز جهت اجرای الگوریتمهای طبقهبندی نیز حائز اهمیت میباشد. در این تحقیق از داده EEG افراد سالم و بیماران مبتال به صرع استفاده شده است. انتخاب ویژگی و بهینه سازی پارامترهای ماشین بردار پشتیبان بصورت همزمان و گامبهگام پیاده سازی شده است. نتایج نهایی نشان دادهاند که انجام این مراحل بصورت همزمان نسبت به گامبهگام به نتایج بهتری از نظر دقت حساسیت خصوصیت و زمان اجرا میانجامد. کلمات کلیدی کاهش ابعاد انتخاب ویژگی بهینهسازی تشخیص بیماری صرع طبقهبند ماشین بردار پشتیبان الگوریتم جستجوی گرانشی باینری تبدیل ویولت تبدیل فوریه کسری سریع 35
-1 مقدمه صرع اختالل گذرای عملکرد مغزی است که در اثر تخلیه الکتریکی غیر طبیعیی در سلولهای عصبی مغز ایجاد میشود. صرع بیشتر احتمال دارد که در کودکان خردسال و یا افراد باالی سن 56 سال رخ دهد با این حال احتمال ابیتال بیه ن در هر سنی وجود دارد [7]. سیگنال EEG نقش بسیار مهمی در تشخیص این بیماری ایفا میکند. ثبتهای EEG که توسط دستگاههای ثبت سیار ضبط میی شوند اطالعاتی با طول بسیار باال تولید میکنند کیه تشیخیص ناحییه صیرعی نیازمند مدت زمان طوالنی برای نالیز کل اطالعات توسط شیخص متخصیص میباشد. روشهای سنتی نالیز خسته کننده میباشند به همیین دلییل در سیال های اخیر تعداد بسیار زیادی سیستم اتوماتیک برای تشخیص صرع بوجود مده است. 1 ماشین بردار پشتیبان مدلی برای طبقهبندی است که از فر یند موزش با دادههای موزشی تولید میشود. بعد از ن طبقهبندی براساس مدل موزش دیده شده اجرا میشود. دقت مدل SVM تا حد زیادی وابسته به انتخاب پارامترهای مدل است. پارامترهایی که در SVM باید بهینه شوند شامل پارامتر جریمه C و 4 3 پارامترهای هسته مانند گاما ( ) برای هسته تابع پایه شعاعی است. هدف از انتخاب ویژگی انتخاب یک زیرمجموعه مرتبط pr ویژگی از یک مجموعهای از p ویژگی )pr<p( در یک دیتاست است که موجب کاهش پیچیدگی و افزایش عملکرد با انتخاب ویژگیهای برجسته میشود. بنابراین انتخاب ویژگی نقش مهمی در سیستمهای تشخیص بیماری دارد. انتخاب ویژگی و بهینهسازی پارامترهای SVM دقت طبقهبندی را به میزان قابل توجهی باال میبرد. در [11] از ترکیب GSA با SVM برای انتخاب زیرمجموعه بهینه ویژگیها و تنظیم پارامترهای SVM برای بهبود دقت طبقهبندی استفاده شده است. در این روش p پارامتر باینری جهت انتخاب 6 ویژگی و دو پارامتر مقدار - حقیقی جهت انتخاب پارامترهای SVM در نظر و بهینهسازی پارامترهای گرفته شده است. انتخاب ویژگی بوسیلهی 5 BGSA انجام شده است. دقت طبقهبندی و تعداد ویژگی- 7 RGSA بوسیلهی SVM های انتخاب شده دو معیار استفاده شده در تعریف تابع مطلوبیت است. نتایج نشان داده که روش ارائه شده قادر به انتخاب درست ویژگیهای ورودی تبعیض میز و دقت طبقهبندی باال است که قابل مقایسه و یا بهتر از سیستمهای طبقه- بندی مشابه است. در [7] از الگوریتم جستجوی گرانشی برای انتخاب ویژگی 8 استفاده شده است. در این مسئله یک جرم شامل دو پارامتر مقدار - حقیقی )پارامترهای )SVM و p پارامتر باینری برای انتخاب ویژگی است. دقت طبقه- بندی و تعداد ویژگیهای انتخاب شده معیار ترکیبی استفاده شده برای تابع مطلوبیت است. نتایج این روش با نتایج اجرای روشهای GA-SCM و PSO- GSA-SVM مقایسه شده است. نتایج زمایشها نشان داده که روش SVM کارایی محاسباتی بهتری در مقایسه با نتایج حاصل از روشهای دیگر ارائه می- دهد و به دقت باالتری دست مییابد. در [4] الگوریتم جستجوی گرانشی باینری به عنوان یک روش انتخاب ویژگی با طبقهبند پرسپترون چند الیه به منظور طراحی یک سیستم تشخیص نفوذ که قادر به کاهش ویژگیهای بیربط در مرحله انتخاب ویژگی در مجموعه داده تشخیص نفوذ KDD 99 است به منظور بهبود عملکرد پرسپترون چند الیه و رسیدن به نرخ دقت طبقهبندی باالتر استفاده شده است. نتیجه این مطالعه از سیستم مطرح شده با سیستمهای دیگر که الگوریتم ژنتیک و PSO به عنوان یک روش انتخاب ویژگی است مقایسه شده و نشان داده شده که کارایی محاسباتی بهتر و دقت باالتری دارد زیرا تابع مطلوبیت مطرح شده در الگوریتم جستجوی گرانشی برابر 111 است. در [3] الگوریتم جستجوی گرانشی باینری به عنوان یک روش جدید انتخاب ویژگی توسعه یافته و برای مطالعات QSAR کد گذاری شده است. مدل تولید شده بطور رضایتبخشی تغییرات تجربی در فعالیت بیولوژیکی ترکیبات مجموعه داده را توصیف کرده و به بیش از %99 از واریانس دست یافته است. در پژوهشهای پیشین انتخاب ویژگی و بهینهسازی پارامترهای SVM فقط بصورت همزمان صورت گرفته و پیادهسازی این روش بصورت گامبهگام در نظر گرفته نشده است. همچنین این روش تاکنون بر روی دیتاست صرع ندرزجاک اعمال نشده است. در این مقاله از الگوریتم جستجوی گرانشی باینری جهت انتخاب ویژگی و بهینهسازی پارامترهای SVM بصورت همزمان و گامبه- گام استفاده شده است. ادامه این مقاله به شرح زیر میباشد: در بخش و 3 به ترتیب مقدمهای بر مفاهیم پایهای ماشین بردار پشتیبان و الگوریتم جستجوی گرانشی باینری ورده شده است. در بخش 4 انتخاب ویژگی و بهینهسازی پارامترهای SVM براساس BGSA توضیح داده شده در بخش 6 نتایج تجربی استفاده از روش ارائه شده برای طبقهبندی افراد سالم و بیماران مبتال به صرع ارائه شده است. در بخش 5 خالصهای از نتایج و نتیجهگیری کلی ذکر شده است. - ماشین بردار پشتیبان 9 SVM یکی از روشهای یادگیری بانظارت است که از ن برای طبقهبندی و رگرسیون استفاده میکنند. مبنای کاری طبقهبند SVM دستهبندی خطی داده- ها است و در تقسیم خطی دادهها سعی میشود خطی انتخاب شود که حاشیه اطمینان بیشتری داشته باشد. 11 تابع جداساز برای SVM دو کالسه عبارت است از: n f ( x) y k x x b )1( (, ) 1 n تعداد نمونه های موزشی x نمونه موزشی ام و y طبقه صحیح برای نمونه موزشی ام است. مقدار y برای یکی از کالسها 1 و برای 9 Supervse learnng 10 Dscrmnaton Functon 1 Support Vector Machne (SVM) penalty 3 kernel 4 raal bass functon (RBF) 5 real-value 6 Bnary Gravtatonal search algorthm (BGSA) 7 Real Gravtatonal search algorthm (RGSA) 8 mass 36
)8( کالس دیگر 1- درنظر گرفته میشود. b مقدار بایاس تابع است. مقادیر ضرایب طبقهبند هستند که بهمراه b در حین موزش تعیین میشوند. تابع (x )k x 1, یک هسته است. دو نمونه از متدوالترین هستههایی که برای SVM استفاده میشوند عبارتاند از: polynomal kernel p k ( x1, x, p) (1 x x) )( x1 x RBF kernel k( x 1, x, ) e )3( و به ترتیب پارامترهای قابل تنظیم برای هستههای در روابط فوق p در رابطه )3( با حل مسأله بهینه- چندجملهای و RBF هستند. ضرایب سازی زیر بدست می یند: maxmze W( ) n 1 n (, ) 1, y y k x x )4( subect to ثابت n 1 y 0, 1,...,n an 0 C C در رابطه فوق یکی از پارامترهای طبقهبند SVM است. یکی از روش- های متدوال و سریعی که برای حل مسأله بهینهسازی فوق و یا بعبارت دیگر است [11]. برای موزش SVM پیشنهاد شده است روشی موسوم به 11 SMO اثر SVM بستگی به انتخاب هسته پارامترهای هسته حاشیه نرم و پارامتر C دارد. در این تحقیق از تابع هسته RBF برای SVM استفاده شده است چون تابع هسته RBF میتواند داده با ابعاد باال را نالیز کند و فقط نیاز به دو پارامتر و C دارد. 3- الگوریتم جستجوی گرانشی باینری )6( راشدی و همکاران [1] الگوریتم جستجوی گرانشی باینری را مطرح کردند که میتواند بصورت زیر شرح داده شود. سیستم متشکل از m جرم است. هر جرم دارای موقعیتی است که جوابی از مسأله است. موقعیت بعد از جرم با x )5( نشان داده شده است 1 D X ( x,..., x,... x ) در این سیستم در زمان t به هر جرم از سوی جرم در جهت بعد نیرویی به اندازه میشود. F وارد میشود. ( جرم گرانشی جرم Mg مقدار این نیرو طبق رابطه )7( محاسبه G( ثابت گرانش در زمان t و R )7( فاصله بین دو جرم و هستند. برای تعیین فاصله بین اجرام از فاصله همینگ استفاده شده است. در رابطه )7( ε یک عدد بسیار کوچک است. نیروی وارد بر جرم در جهت بعد در زمان t برابر مجموع تمام نیروهایی است که سایر اجرام سیستم بر جرم وارد میکنند. F m 1, r F طبق قانون دوم نیوتن شتاب هر جرم در جهت بعد متناسب با نیروی وارد بر جرم در ن جهت بخش بر جرم اینرسی ن است )در رابطه 9 بیان شده است(. در این رابطه شتاب جرم در جهت بعد در اینرسی جرم با M نشان داده شده است. زمان t با a و جرم ( F a )9( M سرعت هر جرم برابر مجموع ضریبی از سرعت فعلی جرم و شتاب جرم است )رابطه )11((. موقعیت جدید بعد از جرم طبق رابطه )11( محاسبه می- شود. V ( t 1) r V a r )11( )11( و x ( t 1) x V ( t 1) r ها اعداد تصادفی با توزیع یکنواخت در بازه ]1 1[ هستند که برای حفظ خاصیت تصادفی بودن جستجو استفاده شدهاند. برای تنظیم ضریب گرانش از رابطه )1( استفاده میشود. در این رابطه ثابت گرانش به صورت خطی کاهش مییابد. t G G0 (1 ) T از نگاشت تابع هدف اجرام استفاده میشود. به گونهای بهتر جرم بیشتری نسبت داده شود. )1( برای تنظیم اجرام که به اجرام با شایستگی ft worst( Mg )13( best( worst( M 1 Mg )14( در این روابط ( ft بیانگر میزان برازندگی جرم در زمان t است. در مسایل کمینهیابی میتوان از روابط زیر برای محاسبه بهترین و بدترین جرم استفاده کرد. best mn { 1,..., m} ft )16( worst max { 1,..., m} ft )15( در ابتدای تشکیل سیستم هر جسم به صورت تصادفی در یک نقطه از فضا قرار میگیرد که جوابی از مسأله است. در هر لحظه از زمان اجرام ارزیابی شده سپس تغییر مکان هر جرم پس از محاسبه روابط )11-7( محاسبه میشود. پارامترهای سیستم شامل جرم گرانشی جرم اینرسی و ثابت گرانش نیوتن هستند که در هر مرحله طبق روابط )16( و )15( بروز رسانی میشوند. شرط توقف میتواند پس از طی مدت زمان مشخصی تعیین شود. در فضای گسسته موقعیت ذره در هر بعد با صفر و یک نمایش داده می- شود. حرکت ذره در هر بعد به معنای تغییر مقدار ن از صفر به یک یا از یک به صفر خواهد بود. ایده انجام این کار به این صورت است که سرعت جرم در هر G( Mg F ( x x ) R 11 Sequental Mnmal Optmzaton 37
بعد به صورت یک تابع احتمال در نظر گرفته میشود و بر مبنای ن ذره با یک احتمال در ن بعد تغییر موقعیت میدهد. در واقع در نسخه باینری به جای نکه بیانگر جابجایی ذره باشد احتمال صفر یا یک بودن را نشان میدهد. از نجا که در الگوریتم باینری باید به صورت تابع احتمال تعریف شود لذا باید به بازه ]1-1[ محدود شود. برای این منظور از رابطه )17( استفاده می- شود. S( V ) tanh( v ) )17( پس از محاسبه تابع احتمال فوق جرم در هر بعد مطابق با رابطه )18( حرکت می کند. طبق این رابطه جرم با یک احتمال تغییر موقعیت میدهد که هر چه سرعت جرم در یک بعد بیشتر باشد احتمال حرکت جرم در ن بعد بیشتر می شود. Ran یک عدد تصادفی با توزیع یکنواخت در بازه ] 1 و 1 [ است. f ran S( V ( t 1)) tehn )18( x ( t 1) complememe nt( x ) else x ( t 1) x 4- داده و روش کار 1-4- انتخاب داده در این مقاله از سیگنالهای EEG توصیفی مربوط به ندرزجاک و همکاران ][ استفاده شده است. این دیتاست شامل پنج گروه A تا E بوده و هر گروه دادهها شامل 111 عدد سیگنال EEG )به مدت 3/5 ثانیه) متعلق به دو نیمکره مغزی است. فرکانس نمونه برداری سیگنالها 17375 هرتز با رزولوشن 1 بیتی 1 است. از این سیگنالها رتیفکت هایی چون حرکت عضالت و چشم حذف شده است. فیلتر میان گذر 1/63-41 هرتز تنظیم شده است. این سیگنالها متعلق به دامنه سنی 5 تا 43 ساله (میانگین 8 سال) است که با استاندارد سیستم 11-1 نمونه برداری شده است. مجموعههای A و B شامل سیگنالهای گرفته شده از سطح سر 6 داوطلب سالم است. داوطلبان در زمان ثبت سیگنال بیدار و در حالت استراحت با چشمان باز )گروه A( و چشمان بسته )گروه B( بودهاند. مجموعه- های C و D و E سیگنالهایی است که از پنج بیمار ضبط شده است. بخشهای در مجموعهی D از درون ناحیه صرع ثبت شده و سیگنالهایی مجموعه C از ناحیه هیپوکامپ نیمکره مخالف مغز ضبط شدهاند. در حالی که مجموعههای C و D فقط شامل فعالیتهای اندازهگیری شده در فواصل حمالت صرع است مجموعه E تنها شامل فعالیتهای صرعی است. در این مقاله از سیگنالهای دو گروه A و E که به ترتیب مربوط به افراد سالم و افراد مبتال به صرع میباشد استفاده شده است. 14 13 برای استخراج ویژگی از سیگنالها از دو روش تبدیل ویولت و تبدیل 16 فوریه کسری سریع استفاده شده است. ضرایب ویولت قادرند اطالعات زمان - فرکانس سیگنال را به طور توام توصیف کنند. در این راستا باید تعداد سطوح تجزیه و نوع ویولت مشخص شوند. در این مقاله ابتدا سیگنال با استفاده از تابع mwtec در متلب با ویولت b4 در 11 سطح تجزیه شده و ضرایب ویولت استخراج شده است. پس از ن ویژگیهای انرژی واریانس طول موج و نتروپی ضرایب جزئیات و تقریب ویولت محاسبه شده است که در نهایت هر سیگنال دارای 44 ویژگی است. همچنین تبدیل فوریه کسری سریع مرتبه 6/5 در محیط متلب پیادهسازی شده و از هر سیگنال 4197 ویژگی استخراج شده است سپس این ویژگیها بازهبندی شدهاند به این صورت که در هر بازه 41 ویژگی موجود میباشد. به این ترتیب هر سیگنال دارای 17 بازه میباشد. سپس برای هر بازه ویژگیهای نتروپی واریانس طول موج و لگاریتم انرژی محاسبه شده است. در نهایت هر سیگنال دارای 58 ویژگی است. --4 الگوریتم جستجوی گرانشی باینری برای انتخاب ویژگی و بهینهسازی پارامترهای SVM انتخاب ویژگی یکی از فعالیتهای مهم در زمینههای مختلف از جمله بینایی کامپیوتر پردازش داده داده کاوی تشخیص الگو یادگیری ماشین و مسائل طبقهبندی است. در زمینه تشخیص الگو ویژگیها میتواند به عنوان یک روش برای تمایز یک کالس شی از دیگری استفاده شود. زمانی که ویژگیهای سیگنال استخراج میشوند مسئله مهم ویژگیهایی است که در فر یند تشخیص مرتبط هستند. در پایگاه دادههای دنیای واقعی ویژگیهای بیربط اضافی یا گمراه کننده بسیاری موجود هستند که غیر قابل استفاده هستند. در چنین مواردی انتخاب ویژگی برای غلبه بر مسئله نفرین بعدیت مورد استفاده قرار می- گیرد. بنابراین انتخاب ویژگی نقش مهمی در سیستمهای تشخیص بیماری دارد و انتخاب بهتر ویژگیها نتایج با دقت بازیابی باالتری دارند. انتخاب پارامترهای مناسب برای طبقهبند SVM نیز دقت تشخیص را به میزان قابل توجهی باال میبرد. در این مقاله یک روش انتخاب ویژگی و بهینهسازی پارامترهای SVM بر اساس BGSA ارائه شده است. دو عامل اصلی تعریف این الگوریتم نمایش 17 15 پارامترها و بردار ویژگی بصورت موقعیت عامل و تعریف تابع شایستگی است که خوبی یک عامل را ارزیابی میکند. این دو عامل کلیدی عبارتند از: 1--4- نمایش پارامترها و بردار ویژگی بصورت عامل در اینجا هدف استفاده از BGSA برای بهینهسازی پارامترهای SVM و انتخاب ویژگیهای مناسب از بین ویژگیهای استخراج شده از هر سیگنال EEG )با استفاده از تبدیل ویولت 44 ویژگی و با استفاده از تبدیل فوریه کسری سریع 58 ویژگی حاصل شد( بطور همزمان است. بنابراین هر جرم شامل سه قسمت و و ماسک ویژگی ( ) است. 15 Fast Fractonal Foure transform(ffrft) 16 tnhnt 17 Ftness functon 1 artfact 13 Feature extracton(fe) 14 Wavelet transform(wt) 38
شکل )1( یک جرم باینری را نشان میدهد نشاندهنده مقدار پارامتر C و نشاندهنده مقدار پارامتر است. تعداد بیتهای نشاندهنده پارامتر و تعداد بیتهای نشاندهنده پارامتر است. ( ) ماسک ویژگی برای جرم را نمایش میدهد برابر با تعداد کل ویژگیها )برای تبدیل ویولت 44 و برای تبدیل فوریه کسری سریع 58( است. بیت با مقدار یک مشخص میکند که ویژگی متناظر با این بیت جهت مشارکت در طبقهبندی انتخاب شده و مقدار صفر نشاندهنده عدم انتخاب ویژگی متناظر با این بیت برای مشارکت در طبقهبندی است. رشته بیتی نشاندهنده جنوتایپ پارامترهای γ و با استفاده از رابطه )19( به فنوتایپ تبدیل میشود. max p mn p p mn p )19( l 1 فنوتایپ رشته بیتی mn p مقدار مینیمم پارامتر max p مقدار ماکزیمم پارامتر مقدار دهدهی رشته بیتی و l طول رشته بیتی است. شکل )1(. جرم شامل یک ماسک برای انتخاب ویژگی و بهینهسازی --4- تابع مطلوبیت پارامترها پس از ایجاد جمعیت اولیه اجرام برای هر جرم مقدار مطلوبیت ن که در اینجا ترکیبی از دقت طبقهبندی و تعداد ویژگیهای انتخابی است )رابطه 1( محاسبه میشود. شرط خاتمه برای هر اجرای برنامه رسیدن به دقت طبقهبندی %111 و یا حداکثر تعداد مجاز )1( برای تکرار برنامه و یا عدم تغییر مقدار تابع مطلوبیت در طبقهبندی برای پنج تکرار متوالی برنامه تعریف شده است. در نهایت جرمی که باالترین مقدار مطلوبیت در طبقهبندی را دارد پارامترها و ویژگیهای مناسب را مشخص میکند. هدف یک عامل بیشینه ساختن تابع مطلوبیت با انتخاب ویژگیها و پارامترهای مناسب است. 19 18 از نجا که در کاربردهای پزشکی حساسیت و خصوصیت بسیار حائز اهمیت است عالوه بر دقت طبقهبندی مقادیر حساسیت و خصوصیت نیز محاسبه شده است. TP Sensvty (%) TP FN )3( TN Specfty (%) FP TN )4( FN به ترتیب نشاندهنده مثبت واقعی منفی که در ن FP TN TP و واقعی مثبت کاذب و منفی کاذب است. 0 3-4- اعتبارسنجی متقابل اعتبارسنجی متقابل مرتبه k یک روش برای بهبود روش holout است. در این روش مجموعه داده به k زیرمجموعه تقسیم میشود و متد k holout مرتبه تکرار میشود. در هر مرتبه یکی از k زیرمجموعهها بعنوان مجموعه زمون و 1-k مجموعه دیگر با هم مجموعه موزش را تشکیل میدهند. سپس متوسط خطا در تمام k زمونها محاسبه میشود. هر نقطه مجموعه داده دقیقا یک مرتبه در مجموعه زمون و 1-k مرتبه در مجموعه موزش ظاهر میشود. تقسیمبندی دادهها در این k fol بایستی به گونهای باشد که نمونههای موجود در یک fol صرفا از یک طبقه نباشند و شامل نمونههای هر دو طبقه )طبقه افراد سالم و طبقه بیماران مبتال به صرع( باشند. اعتبارسنجی متقابل مرتبه k-k یعنی متد اعتبارسنجی متقابل مرتبه k k مرتبه اجرا شود و در هر مرتبه تقسیمبندی دادهها در k fol نسبت به مرتبه- های پیشین متفاوت باشد. سپس متوسط خطا در تمام k زمونها محاسبه می- شود. در کاربرد فعلی از اعتبارسنجی متقابل مرتبه 11-11 استفاده شده است. 4-4- پیادهسازی و طراحی آزمایشات در این مقاله انتخاب ویژگی و بهینهسازی پارامترهای SVM به دو صورت همزمان و گامبهگام انجام شده است. روش انتخاب ویژگی و بهینهسازی پارامترهای SVM براساس BGSA بصورت گامبهگام همانطور که در شکل )( نشان داده شده است به این صورت عمل میکند که نخست مرحله انتخاب ویژگی در تعداد تکرارهای مشخصی صورت میگیرد و پس از بدست وردن بردار ویژگی بهینه مرحله بهینهسازی پارامترهای SVM صورت میگیرد و پس از یافتن پارامترهای مناسب برای SVM اجرای برنامه خاتمه مییابد. در روش انتخاب ویژگی و بهینهسازی پارامترهای SVM براساس BGSA بصورت همزمان انتخاب ویژگی و بهینهسازی پارامترهای SVM تنها در یک گام انجام میشود. دقت این مدل با روش اعتبارسنجی متقابل مرتبه 11-11 ارزیابی شده است. 18 Sensvty 19 Specfcty 0 Cross valaton s f ftness WA Accuracy WF (1 ) )1( n f در رابطه باال وزن برای دقت طبقهبندی دقت طبقه- بندی وزن برای تعداد ویژگیهای انتخابی تعداد کل ویژگیهای هر سیگنال و تعداد ویژگیهای انتخابی توسط عامل است که در طبقهبندی از نها استفاده شده است. با 1/8 و با 1/ مقداردهی شده است. دقت طبقهبندی با استفاده از رابطه )1( محاسبه میشود. T assess( t ) 1 Accuracy ( T), t T T, )1( 1, f classfy t. c, assess( )( 0, otherwse T مجموعهای از یتمهای داده است که بایستی طبقهبندی شوند )مجموعه زمون( t عضوی از مجموعهی t.c T کالس یتم t و ( classfy نتیجهی طبقهبندی یتم t با استفاده از طبقهبند ماشین بردار پشتیبان است. در BGSA 39
Intalze Populaton Feature Selecton Tran SVM Classfer wth the Feature subset an Calculate Accuracy wth 10-10- fol cross valaton Evaluate Ftness Intalze Populaton Tran SVM Classfer wth the Feature subset an Selecte Parameters an Calculate Accuracy wth 10-10 fol cross valaton Evaluate Ftness Termnaton No Parameters Selecton by BGSA Save the best Parameters Termnaton Yes Parameters Selecton Feature subset Yes Optmze Parameters No Save the best Feature subset Feature Selecton by BGSA شکل )(. دیاگرام الگوریتم جستجوی گرانشی باینری برای انتخاب ویژگی و بهینهسازی پارامترهای SVM بصورت گامبهگام 1 در الگوریتم جستجوی گرانشی باینری تعداد عاملها و تعداد تکرارها به ترتیب 1 و 1 تعیین شده و جمعیت اولیه بصورت تصادفی مقدار دهی شده است. در BGSA به مقدار 111 داده شده است. ثابت گرانش G مقدار اولیه میگیرد و با زمان با استفاده از معادله )1( کاهش مییابد. برای و به ترتیب مقادیر 1 1 1 یک و 11 در نظر گرفته شده است. شرط خاتمه برای هر اجرای برنامه رسیدن به دقت طبقهبندی %111 و یا حداکثر تعداد مجاز )1( برای تکرار برنامه و یا عدم تغییر مقدار تابع مطلوبیت در طبقهبندی برای پنج تکرار متوالی برنامه تعریف شده است. همه زمایشها در محیط MATLAB 01a صورت گرفته است. هر زمایش به تعداد 11 مرتبه اجرا شده و میانگین و انحراف معیار نتایج اجراهای هر زمایش در جدول مربوط به ن ذکر شده است. 5. نتایج آزمایشها در این مقاله از دو گروه A و E سیگنالهای EEG مربوط به ندرزجاک استفاده شده است. برای استخراج ویژگی از سیگنالها روشهای تبدیل ویولت و تبدیل فوریه کسری سریع بکار برده شده است. از BGSA جهت یافتن پارامترها و ویژگیهای مناسب برای شرکت در طبقهبندی استفاده شده است. نرخ طبقه- بندی با SVM و تعداد ویژگیهای انتخابی بعنوان مقدار مطلوبیت برای هر راه- حل عمل میکند. در جدولهای )1( و )( نتایج مربوط به انتخاب ویژگی و بهینهسازی پارامترهای SVM بصورت همزمان و گامبهگام با استفاده از دو روش استخراج ویژگی تبدیل ویولت و تبدیل فوریه کسری سریع ورده شده است. با مشاهده نتایج ذکر شده در این دو جدول مشخص میشود که استفاده از روش تبدیل ویولت نسبت به تبدیل فوریه کسری سریع منجر به نتایج بهتری از نظر دقت حساسیت خصوصیت زمان اجرا و تعداد ویژگیهای انتخابی میشود. با استفاده از این روش مطرح شده تعداد ویژگیها بطور قابل توجهی کاهش یافته و این به معنای کاهش پیچیدگی و افزایش کارایی است. در جدول )3( روش ارائه شده با دیگر سیستمهای تشخیص صرع از نظر دقت طبقهبندی مقایسه شده است. نتایج زمایشهای انجام شده در این مطالعه نشان میدهند که انجام انتخاب ویژگی و بهینهسازی پارامترهای ماشین بردار پشتیبان بطور همزمان در مقایسه با روشهای دیگر منجر به نتایج بهتری میشود. در روش انتخاب ویژگی و بهینهسازی پارامترها بطور همزمان نسبت به روش مرحله به مرحله بودن ن برنامه در مدت زمان کمتری اجرا میشود و به 1 teratons 40
میزان دقت حساسیت و خصوصیت باالتری منجر میشود. زیرا در پیادهسازی همزمان انتخاب ویژگی و بهینهسازی پارامترهای SVM با هم و در یک مرحله انجام میشوند که این خود سبب اجرای برنامه در مدت زمان کمتری میشود. در جدولهای )1( و )( ستون NOF تعداد ویژگیه یا انتخابی را نشان میدهند. جدول )1(. نتایج حاصل از انتخاب ویژگی و بهینهسازی پارامترهای FE WT FFrFT BGSA بطور همزمان با استفاده از SVM Accuracy 94 /47± 0 / 04 97 /74± 0 / 8 Sensvty 99 /87± 0 / 06 94 /36± 0 / 74 Spesfcty 94 /68± 0 / 84 97 /78± 0 / 64 NOF 3± 3 /8 7 /8± /0 جدول )(. نتایج حاصل از انتخاب ویژگی و بهینهسازی پارامترهای FE WT FFrFT BGSA بصورت گامبهگام با استفاده از SVM Accuracy 94 /74± 8 /88 97 /77± 0 /96 Sensvty 94 /4± 8 / 7 97 /84± 8 / 7 Spesfcty 94 /78± 0 / 9 97 /± 8 / 06 NOF 86 /9± 3 /0 3 /3± 8 /4 Tme(s) 697 /67± 78 /48 887 /7± 88 /88 Tme(s) 8943 /7± 894 /87 473± 3048 /9 جدول )3(. مقایسه دقت طبقهبندی روش مطرح شده برای تشخیص صرع با دقت طبقهبندی بدست آمده با روشهای دیگر Author (year) Chua K. C [6] Chua K. C [6] Suparerk Janarastt [8] Polat an Günes [4] Our stuy HOS Metho Power Spectrum Densty the Wavelet-Base Scale Varance Feature fast Fourer transform (FFT) + ecson tree classfer Wavelet + GSA + SVM Accuracy (%) 9/88 44/64 97-99 94/63 94 /47. ± 0 / 04 6. نتیجهگیری انتخاب پارامترها و ویژگیهای مناسب برای شرکت در طبقهبندی دقت تشخیص را به میزان قابل توجهی باال میبرد. زیرا انتخاب ویژگی سبب حذف ویژگیهای بیربط و کار با تعداد کمتری ویژگی میشود که این خود زمان اجرا را کاهش داده و سرعت اجرای برنامه را باال میبرد. در این مقاله از BGSA برای انجام انتخاب ویژگی و یافتن پارامترهای بهینه C و σ برای SVM به دو صورت همزمان و گامبهگام استفاده شده است. نتایج زمایشها نشان دادند که انجام انتخاب ویژگی و بهینهسازی پارامترهای SVM بصورت همزمان نسبت به گامبهگام به نتایج بهتری از نظر دقت حساسیت خصوصیت و زمان اجرا می- انجامد. سیستم پیشنهادی در سیستمهای پزشکی که در نها سطح باالی دقت مطلوب است میتواند به عنوان یک ابزار کمکی به جراحان مغز و اعصاب در تشخیص بیماری صرع باشد. این سیستم همچنین میتواند به عنوان یک ابزار تشخیصی قدرتمند برای پرسنل پزشکی انتقال یافته به مناطق دور افتاده که در ن کمبود شدید متخصصین مغز و اعصاب موزش دیده وجود دارد عمل کند. در ادامه این پژوهش میتوان این تحقیق را پیادهسازی سخت افزاری نموده و نیز میتوان اثر استفاده از انتخاب نمونه را در بهبود دقت طبقهبند ماشین بردار پشتیبان بررسی کرد. مراجع ]1[ ع. راشدی ح. نظام بادی پور " الگوریتم جستجوی گرانشی باینری " هشتمین کنفرانس سیستمهای هوشمند دانشگاه فردوسی مشهد 1385. [] Anrzeak RG, Wman G, Lehnertz K, Reke C, Dav P, Elger CE. Epleptc process as nonlnear etermnstcs ynamcs n astochastc envronment: An evaluaton on mesal temporal lobe eplepsy. Eplepsy Res 001; 44(-3): 19-140. [3] B. M. Bababan an M. Mousav, Gravtatonal Search Algorthm_: A New Feature Selecton Metho for QSAR Stuy of Antcancer Potency of mazo[4,5-b]pyrne Dervatves, Chemometrcs an Intellgent Laboratory Systems, vol. 1,, pp. 1 11, (013). [4] A. R. Behat; A. Mustapha; H. Nezamaba Pour; M. N. Sulaman; N. Mustapha, Feature Subset Selecton Usng Bnary GSA For Intruson Detecton System In Intellgent Informaton An Database Systems, Sprnger Berln Heelberg, Pp. 377-386, (013). [5] D.Brabury, Volunteers Gue to an EEG, Insttute Of Neurology Wellcome Department Of Imagng Neuroscence, http://www.fl.on.ucl.ac.uk/eegvolunteergue.pf [6] K. C Chua, V Chanran, Acharya Raenra, C. M Lm, (007), Automatc Ientfcaton of Eplepsy by HOS an Power Spectrum parameters usng EEG Sgnals: A Comparatve stuy 30th Annual Internatonal IEEE EMBS Conference Vancouver, Brtsh Columba, Canaa, August 0-4, 008. [7] A. Jan, D. Zongker, Feature selecton: evaluaton, applcaton, an small sample performance, IEEE Transacton on Pattern Recognton an Machne Intellgence 19 () (1997) 153 158. [8] Suparerk Janarastt, Classfcaton of the Epleptc EEGs Usng the Wavelet-Base Scale Varance Feature Internatonal Journal of Apple Bomecal Engneerng, Vol.3, No.1, (010). [9] J. C. Platt, Fast tranng of support vector machnes usng sequental mnmal optmzaton, In: (Es) B. Scholkopf, C. Burges, A. J. Smola, Avances n Kernel Methos - Support Vector Learnng, MIT Press, Cambrge, Massachusetts, 1999, chapter 1, pp. 185-08. [10] K. Polat an S. Günes, (007), Classfcaton of epleptc form EEG usng a hybr system base on ecson tree classfer an fast Fourer transform, Apple Mathematcs an Computaton, vol. 187, no., pp. 1017-106. [11] S. Sarafraz, an H. Nezamaba-pour, Facng the classfcaton of bnary problems wth a GSA-SVM hybr system, Mathematcal an Computer Moellng, (011), DOI: http://x.o.org/10.1016/.mcm.011.06.048 41